Upload data, preprocessing

Apply KMeans clustering

Vis clusters

Green Кластер 1- перемещаются не очень активно (пенсионеры, неактивные люди, те которые работают/учатся в том же районе что и живут или нехватка данных о юзере).

Blue Кластер 2 - перемещаются средне (люди которые работают, ходят в учреждения образования, в районах которые находятся недалеко от их места жительства, но перемещаются чаще чем кластер 1) Вероятней всего активно перемещаются по выходным.

Orange Кластер 3 - перемещаются очень активно (люди которые работают и живут в разных районах/обласях, ездят в командировки, имеюют родственников в других областях, школьники и студенты, которые едут в другой район/область на учебу) Очень активный кластер пользователей!


Green Cluster 1 - people who are not very active (pensioners, inactive people, people who work/study in the same region as they live or insufficient number of data about user).

Blue Cluster 2 - move medium (people who work, going to educational institutions in regions that are close to their place of residence, but move more often than the cluster 1). Most likely they actively move on weekends.

Orange Cluster 3 - Move very actively (people who work and live in different districts/regions, travel on business trips, have relatives in other regions, schoolchildren and students who go to another district/region to study). Very active user cluster.

Predict on 2020 data

В 2020 активные пользователи из кластера 2 начали перемещаться меньше, что напрямую связано с карантином, который был введен в марте 2020.

По фичам

1 - количество посещенных районов за все время

2 - общее время затраченное на перемещение между районами

3 - сумарная пройденная дистанция за все время


Features

1 - number of visited regions for all time

2 - total time spent moving between areas

3 - total covered distance for all time

2.1

Compare 2019 vs 2020 vs Zhytomyr